library(readxl)
<-read_excel("avocado.csv..xlsx")
Caso_Aguacate_xls
library(epiDisplay)
$cat_Aguacate <- ifelse(Caso_Aguacate_xls$`AveragePrice (PRECIO PROMEDIO)` <= 1 , 'promedio-','promedio+')
Caso_Aguacate_xls
$cat_numero_total_vendido <- ifelse(Caso_Aguacate_xls$`Total Volume (NUMERO TOTAL DE AGUACATES VENDIDOS)` <= 850644 , 'ventas menores','ventas mayores')
Caso_Aguacate_xls
$cat_numero_4046_vendido <- ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4046-PEQUEÑO VENDIDOS` <= 293008 , 'ventas menores de 4046','ventas mayores de 4046')
Caso_Aguacate_xls
$cat_numero_4225_vendido <- ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4225-LARGO VENDIDOS` <= 295154 , 'ventas menores de 4225','ventas mayores de 4225')
Caso_Aguacate_xls
$cat_numero_4770_vendido <- ifelse(Caso_Aguacate_xls$`NUMERO TOTAL DE AGUACATE CON PLU 4770-GRANDE VENDIDOS` <= 22839 , 'ventas menores de 4770','ventas mayores de 4770')
Caso_Aguacate_xls
$bolsas_totales <- ifelse(Caso_Aguacate_xls$`Total Bags (BOLSAS TOTALES)` <= 239639 , 'bolsas totales menores','bolsas totales mayores')
Caso_Aguacate_xls
$bolsas_pequeñas <- ifelse(Caso_Aguacate_xls$`Small Bags (BOLSAS PEQUEÑAS)` <= 182194 , 'bolsas pequeñas menores','bolsas pequeñas mayores')
Caso_Aguacate_xls
$bolsas_grandes <- ifelse(Caso_Aguacate_xls$`Large Bags (BOLSAS GRANDES)` <= 54338 , 'bolsas grandes menores','bolsas grandes mayores')
Caso_Aguacate_xls
$bolsas_extragrandes <- ifelse(Caso_Aguacate_xls$`XLarge Bags (BOLSAS EXTRAGRANDES)` <= 3106 , 'bolsas extragrandes menores','bolsas extragrandes mayores') Caso_Aguacate_xls
🥑OBJETIVO: EVALUAR SI HAY ASOCIACION:
Note
BD
Note
🥑DETERMINAR SI HAY ASOCIACION ENTRE EL NUMERO DE AGUACATE DE NUMERO 4046 Y LAS BOLSAS TOTALES
table(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales)
bolsas totales menores bolsas totales mayores
ventas mayores de 4046 599 1865
ventas menores de 4046 14970 815
Note
📊TABLAS DE CONTINGENCIA:📊
📈OBTENER LAS PROPORCIONES DE LA TIPO CON REGION
library(gmodels)
CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=F, prop.c=F, prop.t=F, prop.chisp=F)
Cell Contents
|-------------------------|
| N |
| Chi-square contribution |
|-------------------------|
Total Observations in Table: 18249
| Caso_Aguacate_xls$bolsas_totales
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales menores | bolsas totales mayores | Row Total |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas mayores de 4046 | 599 | 1865 | 2464 |
| 1074.827 | 6244.022 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas menores de 4046 | 14970 | 815 | 15785 |
| 167.778 | 974.677 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
Column Total | 15569 | 2680 | 18249 |
------------------------------------------|-------------------------|-------------------------|-------------------------|
📈OBTENER LAS PROPORCIONES RESPECTO AL TOTAL
CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=F, prop.c=F, prop.t=T, prop.chisp=F)
Cell Contents
|-------------------------|
| N |
| Chi-square contribution |
| N / Table Total |
|-------------------------|
Total Observations in Table: 18249
| Caso_Aguacate_xls$bolsas_totales
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales menores | bolsas totales mayores | Row Total |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas mayores de 4046 | 599 | 1865 | 2464 |
| 1074.827 | 6244.022 | |
| 0.033 | 0.102 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas menores de 4046 | 14970 | 815 | 15785 |
| 167.778 | 974.677 | |
| 0.820 | 0.045 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
Column Total | 15569 | 2680 | 18249 |
------------------------------------------|-------------------------|-------------------------|-------------------------|
📈OBTENER LAS PROPOCIONES (PORCENTAJES() POR FILAS
CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=T, prop.c=F, prop.t=F, prop.chisp=F)
Cell Contents
|-------------------------|
| N |
| Chi-square contribution |
| N / Row Total |
|-------------------------|
Total Observations in Table: 18249
| Caso_Aguacate_xls$bolsas_totales
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales menores | bolsas totales mayores | Row Total |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas mayores de 4046 | 599 | 1865 | 2464 |
| 1074.827 | 6244.022 | |
| 0.243 | 0.757 | 0.135 |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas menores de 4046 | 14970 | 815 | 15785 |
| 167.778 | 974.677 | |
| 0.948 | 0.052 | 0.865 |
------------------------------------------|-------------------------|-------------------------|-------------------------|
Column Total | 15569 | 2680 | 18249 |
------------------------------------------|-------------------------|-------------------------|-------------------------|
📈OBTENER LAS PROPOCIONES (PORCENTAJES() POR COLUMNAS
CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=F, prop.c=T, prop.t=F, prop.chisp=F)
Cell Contents
|-------------------------|
| N |
| Chi-square contribution |
| N / Col Total |
|-------------------------|
Total Observations in Table: 18249
| Caso_Aguacate_xls$bolsas_totales
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales menores | bolsas totales mayores | Row Total |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas mayores de 4046 | 599 | 1865 | 2464 |
| 1074.827 | 6244.022 | |
| 0.038 | 0.696 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas menores de 4046 | 14970 | 815 | 15785 |
| 167.778 | 974.677 | |
| 0.962 | 0.304 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
Column Total | 15569 | 2680 | 18249 |
| 0.853 | 0.147 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
🥑GRAFICA DE NUMERO TOTAL CON NUMERO 4046 CON LAS BOLSAS TOTALES
library(ggplot2)
Attaching package: 'ggplot2'
The following object is masked from 'package:epiDisplay':
alpha
ggplot(data=Caso_Aguacate_xls, aes(x=cat_numero_4046_vendido, fill=bolsas_totales))+geom_bar(position = "dodge")
🥑PRUEBA DE INDEPENDENCIA
FRECUENCIAS ESPERADAS
CrossTable(Caso_Aguacate_xls$cat_numero_4046_vendido,Caso_Aguacate_xls$bolsas_totales, prop.r=F, prop.c=F, prop.t=F, prop.chisp=T)
Cell Contents
|-------------------------|
| N |
| Chi-square contribution |
|-------------------------|
Total Observations in Table: 18249
| Caso_Aguacate_xls$bolsas_totales
Caso_Aguacate_xls$cat_numero_4046_vendido | bolsas totales menores | bolsas totales mayores | Row Total |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas mayores de 4046 | 599 | 1865 | 2464 |
| 1074.827 | 6244.022 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
ventas menores de 4046 | 14970 | 815 | 15785 |
| 167.778 | 974.677 | |
------------------------------------------|-------------------------|-------------------------|-------------------------|
Column Total | 15569 | 2680 | 18249 |
------------------------------------------|-------------------------|-------------------------|-------------------------|
#H1: LA VENTA DE AGUACATE CON NUMERO 4046 SE ASOCIA CON EL NUMERO TOTAL DE BOLSAS VENDIDAS
#H0: LA VENTA DE AGUACATE CON NUMERO 4046 NO SE ASOCIA CON EL NUMERO TOTAL DE BOLSAS VENDIDAS
PRUEBA ESTADISTICA…………………..
library(tigerstats)
chisqtestGC(~cat_numero_4046_vendido+bolsas_totales, data = Caso_Aguacate_xls )
Pearson's Chi-squared test with Yates' continuity correction
Observed Counts:
bolsas_totales
cat_numero_4046_vendido bolsas totales menores bolsas totales mayores
ventas mayores de 4046 599 1865
ventas menores de 4046 14970 815
Counts Expected by Null:
bolsas_totales
cat_numero_4046_vendido bolsas totales menores bolsas totales mayores
ventas mayores de 4046 2102.14 361.86
ventas menores de 4046 13466.86 2318.14
Contributions to the chi-square statistic:
bolsas_totales
cat_numero_4046_vendido bolsas totales menores bolsas totales mayores
ventas mayores de 4046 1074.83 6244.02
ventas menores de 4046 167.78 974.68
Chi-Square Statistic = 8455.675
Degrees of Freedom of the table = 1
P-Value = 0
#Chi-Square Statistic = 8455.675
#Degrees of Freedom of the table = 1
#P-Value = 0 < 0.05 entonces podemos afirmar que se rechaza H0 , existe una asociacion entre ambas variables
📊PASOS PARA MEJORAR GRAFICO DE PRECIOS PROMEDIO DE AGUACATE
library(ggplot2)
# gráfica con ggplot2
ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+
geom_bar()
📊Mejorando el gráfico
ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+
geom_bar()+
xlab("PRECIO PROMEDIO")+
ylab("N° DE AGUACATE")+
ggtitle("Distribución de precio de aguacate")
📊Mejorando el gráfico 2
<-ggplot(data=Caso_Aguacate_xls, aes(x=cat_Aguacate))+
grafico1geom_bar(fill="red", width = 0.5)+
xlab("PRECIO PROMEDIO")+
ylab("N° DE AGUACATE")+
ggtitle("Distribución de precio de aguacate")
+theme_dark() grafico1